智能论文笔记

Bag of Tricks for Long-Tail Visual Recognition of Animal Species in Camera Trap Images

Fagner Cunha , Eulanda M. dos Santos , Juan G. Colonna

分类：计算机视觉

2022-06-24

相机陷阱是监视收集大量图片的野生动植物的策略。从每个物种收集的图像数量通常遵循长尾分布，即，一些类有大量实例，而许多物种只有很小的比例。尽管在大多数情况下，这些稀有物种是生态学家感兴趣的类别，但在使用深度学习模型时，它们通常被忽略，因为这些模型需要大量的培训图像。在这项工作中，我们系统地评估了最近提出的技术 - 即平方根重新采样，平衡的焦点损失和平衡的组软效果 - 以解决相机陷阱图像中动物物种的长尾视觉识别。为了得出更一般的结论，我们评估了四个计算机视觉模型家族（Resnet，Mobilenetv3，EdgitionNetV2和Swin Transformer）和具有不同特征不同的相机陷阱数据集的四个家族。最初，我们用最新的培训技巧准备了一个健壮的基线，然后应用了改善长尾识别的方法。我们的实验表明，Swin Transformer可以在不应用任何其他方法处理不平衡的方法的情况下达到稀有类别的高性能，WCS数据集的总体准确性为88.76％，Snapshot Serengeti的总体准确性为94.97％，考虑到基于位置的火车/测试拆分。通常，平方根采样是一种方法，它最大程度地提高了少数族裔阶级的表现约为10％，但以降低多数类准确性至少4％的代价。这些结果促使我们使用合并平方根采样和基线的合奏提出了一种简单有效的方法。拟议的方法实现了尾巴级的性能与头等阶级准确性的成本之间的最佳权衡。

translated by 谷歌翻译

A Machine Learning Approach for DeepFake Detection

Gustavo Cunha Lacerda , Raimundo Claudio da Silva Vasconcelos

分类：计算机视觉

2022-09-28

随着深层技术的传播，这项技术变得非常易于访问和足够好，以至于对其恶意使用感到担忧。面对这个问题，检测锻造面孔对于确保安全和避免在全球和私人规模上避免社会政治问题至关重要。本文提出了一种使用卷积神经网络检测深击的解决方案，并为此目的开发了一个数据集-celeb -df。结果表明，在这些图像的分类中，总体准确性为95％，提出的模型接近于最新的现状，并且可以调整未来出现的操纵技术的可能性。。

translated by 谷歌翻译

Machine Learning Partners in Criminal Networks

Diego D. Lopes , Bruno R. da Cunha , Alvaro F. Martins , Sebastian Goncalves , Ervin K. Lenzi , Quentin S. Hanley , Matjaz Perc , Haroldo V. Ribeiro

分类：机器学习 | (统计)机器学习

2022-09-07

最近的研究表明，犯罪网络具有复杂的组织结构，但是是否可以用来预测犯罪网络的静态和动态特性。在这里，通过结合图表学习和机器学习方法，我们表明，可以使用政治腐败，警察情报和洗钱网络的结构性特性来恢复缺失的犯罪伙伴关系，区分不同类型的犯罪和法律协会以及预测犯罪分子之间交换的总金额，所有这些都具有出色的准确性。我们还表明，我们的方法可以预期在腐败网络的动态增长过程中，其准确性很高。因此，与在犯罪现场发现的证据类似，我们得出结论，犯罪网络的结构模式具有有关非法活动的重要信息，这使机器学习方法可以预测缺失的信息，甚至预测未来的犯罪行为。

translated by 谷歌翻译

Only Tails Matter: Average-Case Universality and Robustness in the Convex Regime

Leonardo Cunha , Gauthier Gidel , Fabien Pedregosa , Damien Scieurand Courtney Paquette

分类：机器学习

2022-06-20

最近开发的优化方法的平均案例分析可以比通常的最坏情况结果进行更细粒度和代表性的收敛分析。作为交换，该分析需要对数据生成过程的更精确的假设，即假定与问题相关的随机矩阵的预期光谱分布（ESD）的知识。这项工作表明，ESD边缘附近的特征值的浓度决定了问题的渐近平均复杂性。与ESD的完整知识相比，有关此浓度的先验信息是一个更扎实的假设。这种近似浓度实际上是最严重的场景收敛的粗糙性与限制性的先前平均案例分析之间的中间立场。我们还引入了广义的Chebyshev方法，该方法在该浓度的假设下渐近最佳，当ESD遵循β分布时，全球最佳。我们将其性能与经典优化算法（例如梯度下降或Nesterov的方案）进行了比较，我们表明，在平均情况下，Nesterov的方法在渐近差异上几乎是最佳的。

translated by 谷歌翻译

Distributed Graph Learning with Smooth Data Priors

Isabela Cunha Maia Nobre , Mireille El Gheche , Pascal Frossard

分类：机器学习

2021-12-11

图表学习通常是处理或代表结构化数据的必要步骤，当没有明确给出底层图。图表学习通常以完全了解图形信号的全部知识，即涉及图形节点上的数据。但是，有些设置可以容易地或仅具有不可忽略的通信成本来收集数据。在这种情况下，分布式处理看作是一种自然解决方案，其中数据保持主要是本地，并且在通信图上的邻居节点中执行所有处理。我们在此提出了一种新型分布图学习算法，其允许在数据在目标图上平滑的假设下从节点上的信号观察推断图。我们通过本地投影约束解决了分布式优化问题，以推断有效图，同时限制通信成本。我们的结果表明，分布式方法的通信成本低于集中式算法，而不会影响推断图中的精度。随着网络大小的增加，它还可以在通信成本方面更好地缩放，特别是对于稀疏网络。

translated by 谷歌翻译

Kinetics-Informed Neural Networks

Gabriel S. Gusmão , Adhika P. Retnanto , Shashwati C. da Cunha , Andrew J. Medford

分类：机器学习 | 人工智能

2020-11-30

化学动力学和反应工程包括解除反应机制的现象学框架，优化反应性能和化学过程的合理设计。这里，我们利用前馈人工神经网络作为基础函数来解决由描述微蓄电图（MKMS）的差分代数方程（DAE）约束的常微分方程（杂物）。我们提出了一种代数框架，用于反应网络，基本反应类型和化学物种的数学描述和分类。在该框架下，我们证明了在正则化的多目标优化设置中同时训练了神经网络和动力学模型参数，通过估计来自合成实验数据的动力学参数来导致逆问题的解决方案。我们分析了一组方案，以确定可以从瞬态动力学数据检索动力学参数的程度，并评估方法的鲁棒性相对于统计噪声。这种反向动力学杂散的方法可以帮助基于瞬态数据阐明反应机制。

translated by 谷歌翻译

Deep Metric Structured Learning For Facial Expression Recognition

Pedro D. Marrero Fernandez , Tsang Ing Ren , Tsang Ing Jyh , Fidel A. Guerrero Peña , Alexandre Cunha

分类：计算机视觉

2020-01-18

我们提出了一个深度度量学习模型，以创建具有良好定义结构的嵌入子空间。引入了对输出空间上的高斯结构施加高斯结构的新损失函数，以创建这些子空间，从而塑造数据的分布。鉴于其简化和已建立的结构，具有高斯溶液空间的混合物是有利的。它允许快速发现类别内的课程，并在个人课程的质心中识别平均代表。我们还提出了一种新的半监督方法来创建子类。我们说明了我们对面部表情识别问题的方法，并验证FER +，EffectNet，Extended Cohn-Kanade（CK +），Bu-3DFE和Jaffe数据集的结果。我们通过实验证明了学习嵌入的嵌入可以成功地用于各种应用程序，包括表达检索和情感识别。

translated by 谷歌翻译